[Home] AI로 돌아가기

🔗 관련 문서: Wikipedia - 특징 추출

특징 추출 (Feature Extraction)

특징 추출은 원시 데이터를 분석하여 중요한 패턴, 규칙 또는 속성을 찾아내어 기계가 인식할 수 있는 형태로 변환하는 과정을 의미한다. 머신러닝과 딥러닝에서 핵심적인 전처리 단계로 사용된다.

(1) 정의와 역할

특징 추출은 데이터의 중요한 속성(feature)을 자동 또는 수동으로 찾아내어 벡터 형태로 변환하는 과정이다. 이 과정은 컴퓨터가 입력받은 정보를 이해하고 학습하는 데 필수적인 전처리 작업이다.

(2) 작동 방식

  1. 입력 데이터를 수집한다 (예: 이미지, 텍스트, 음성 등).
  2. 데이터 내에 존재하는 중요한 패턴, 경계, 빈도, 색상 등의 특징을 분석한다.
  3. 이 특징들을 벡터(수치적 표현)로 변환하여 모델의 학습 입력값으로 제공한다.

(3) 머신러닝 vs 딥러닝

머신러닝: 사람이 직접 특징 추출을 수행해야 하며, 그 결과를 바탕으로 모델이 학습한다.

딥러닝: 신경망이 데이터로부터 자동으로 특징 추출을 수행하고 분류까지 이어진다.

(4) 개념도

다음은 머신러닝과 딥러닝의 특징 추출 방식 차이를 나타낸 그림이다.

머신러닝 vs 딥러닝 특징 추출 개념도
그림 1. 머신러닝은 사람이 특징을 추출, 딥러닝은 스스로 특징을 추출
출처: 서지영, 난생처음 인공지능 입문(2판), 한빛미디어, 2024

하나 더 알기: 특징 추출이란?

딥러닝에서 컴퓨터가 스스로 학습하려면, 입력받은 데이터를 분석하여 일정한 패턴이나 규칙을 찾고 이를 벡터 형태로 변환해야 한다. 이때 데이터를 요약해주는 수치 정보가 바로 ‘특징’이며, 이 과정을 특징 추출이라고 한다.